Id | Sentence |
---|---|
26953 | Чит илнең нәни кунаклары Төркиянең күренекле җырчысы Сәртап Әрәнәр белән бергә сәхнә алдылар һәм күмәкләшеп “We are the world” дигән җыр башкардылар. |
Id | Sentence |
---|---|
11965 | Журналистларның сорауларына Анжелика Каширина (СТС/«Даешь молодежь», «Домашний»/«Одна за всех»), Юлия Костюшкина, Ника Ицкович («Мачеха», «Менты») һәм Юлия Кашкина («Метро», «Notre Dame de Paris» мюзикллары) җавап бирәчәк. |
Most corpora contain snippets of foreign language text. It is interesting to see where such snippets come from. In this subsection we present sample sentences (of more than 40 characters) of the corpus containing the stopwords the, de, and dem
The foreign language stopwords are chosen to identify snippets in English (the), French, Spanish, Italian (de) or German (dem).
select s_id,sentence from sentences where sentence like "% the %" and length(sentence)>40 limit 10;
Please add more stopwords for more languages.
3.2.4.1 Rank for some international stopwords